iT邦幫忙

2023 iThome 鐵人賽

DAY 28
0

LSTM( Long Short-Term Memory )

是 RNN 的變種,是用來解決梯度消失的問題,也能夠將長序列資料處理的更好
LSTMs 的核心概念是使用閘門來調控記憶,來改善長期記憶

長期依賴問題

  • 在時間序列資料,事件或資訊對未來輸出有關鍵影響,當間隔變長,RNN 就難以處理
  • RNN 只能記住最近的資訊,而對於長時間序列的資訊的處理就會變得困難,會因此受到梯度消失或爆炸的問題
    https://ithelp.ithome.com.tw/upload/images/20231013/20163317j2Y32RCNL7.png

( RNN 短)

圖源: Understanding LSTM Networks -- colah's blog
https://ithelp.ithome.com.tw/upload/images/20231013/201633177GUcjiJCl6.png

( RNN 長)
圖源: Understanding LSTM Networks -- colah's blog

而LSTM 利用遺忘閘和輸入閘成功解決了長期依賴問題

LSTMs 包含多個相互連接的單元,每個單元有四個核心組件:

  1. 記憶單元( Memory Cell )
  2. 遺忘閘( Forget Gate )
  3. 輸入閘( Input Gate )
  4. 更新主要單元( Update Cell State )
  5. 輸出閘( Output Gate )

參考資料

https://colah.github.io/posts/2015-08-Understanding-LSTMs/


上一篇
遷移學習
下一篇
生成對抗網絡( GAN )
系列文
機器學習新手行,相信你也行!30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言